Cos'è mediana statistica?

La mediana statistica è una misura di tendenza centrale usata per descrivere il valore centrale di un set di dati. È il valore che divide gli elementi del dataset in due parti uguali: il 50% dei dati è al di sopra della mediana e il 50% è al di sotto.

Per calcolare la mediana, i dati vengono ordinati in modo crescente o decrescente e il valore centrale viene selezionato come mediana. Se il numero di elementi nel dataset è dispari, la mediana sarà il valore centrale. Se il numero di elementi è pari, la mediana sarà la media dei due valori centrali.

La mediana è utile perché non viene influenzata da eventuali valori estremi o outliers nel dataset, a differenza di altre misure di tendenza centrale come la media aritmetica. Pertanto, la mediana è particolarmente utile quando si desidera analizzare un set di dati che potrebbe contenere valori estremi che potrebbero distorcere la media.

Ad esempio, considera il set di dati: 5, 7, 2, 9, 8, 6, 4, 1, 3. Per calcolare la mediana, i dati vengono ordinati in ordine crescente o decrescente: 1, 2, 3, 4, 5, 6, 7, 8, 9. Poiché il numero di elementi è dispari (9), il valore centrale (5) è la mediana del dataset.

La mediana è ampiamente utilizzata in molti campi, tra cui la statistica, l'economia, la sociologia e la medicina. È particolarmente importante quando si lavora con dati ordinali o quando non è possibile calcolare la media aritmetica a causa della natura dei dati.

Per analizzare la dispersione dei dati intorno alla mediana, è anche possibile calcolare il range interquartile, che rappresenta la differenza tra il primo quartile (il valore che separa il 25% inferiore dei dati) e il terzo quartile (il valore che separa il 75% inferiore dei dati). Il range interquartile è una misura di dispersione robusta rispetto agli outliers.